N. 11 del 1/7/1998

Infoseek: tracciati alternativi
di Alessandro Venturi


Meno potente di Altavista e Hotbot, resta il motore di ricerca più duttile, sicuro e frequentato. Poco efficace nel servizio di directory

Quando si è uno dei motori di ricerca più usati al mondo, un motivo deve esserci. Come nel campo dei motori tradizionali (quelli a scoppio) i più usati sono quelli maggiormente affidabili e versatili, così nel campo dei motori di ricerca. Infoseek1, allora, come la Ford Fiesta? Non proprio, considerando le prestazioni. Se proprio si vuole usare una metafora automobilistica, si pensi piuttosto a un potente fuoristrada. In definitiva Infoseek, sebbene indicizzi solo un terzo della quantità di pagine di Hotbot e Altavista, raggiunge pur sempre la bellezza di trentacinque milioni di url. Inoltre, è il motore che restituisce il minor numero di error 404 (link a pagine rimosse dal Web), di spam (pagine zeppe di parole chiave nascoste come testo invisibile o nei meta tag per accrescere il posizionamento) e di pagine scarsamente rilevanti rispetto a quanto cercato (vedere riquadro).
www.infoseek.com - Infoseek, di cui si vede qui l'home page, è attualmente tra i motori più usati al mondo: più di Alta Vista, Hot Bot e Lycos. I suoi punti forti sono: risultati mirati e facile utilizzo.

Meno completo, più selettivo

Il merito di ciò deriva da una combinazione di tecnica e intervento umano, ibrida ma efficace. Ogni qualvolta si esegue una ricerca, Infoseek calcola un punteggio in base alla presenza delle parole chiave nei meta tag e alla loro frequenza nel testo. Tale tecnica è comune alla maggior parte dei motori di ricerca, ma evidentemente i programmatori di Infoseek sono riusciti a progettare l'algoritmo più efficace. Il punteggio aumenta ulteriormente qualora la pagina rintracciata è presente in uno dei propri canali, soprattutto se il sito cui appartiene ha ottenuto un buon voto dai redattori di Infoseek.

Dunque si tratta di uno strumento di ricerca molto affidabile, cui rivolgersi quando si vogliono risultati pertinenti e non si è disposti a perdere troppo tempo girovagando da un hit all'altro alla ricerca del link giusto.

Ovviamente, bisogna essere disposti a sacrificare la completezza dei risultati. Anche per quanto riguarda i diciassette canali tematici, Infoseek semplifica le cose limitandosi a contenere circa 400.000 siti contro gli oltre 800.000 di Yahoo! Stando a quanto dichiarato dai responsabili, la metà catalogata da Infoseek è quella qualitativamente migliore, fatto confermato anche dagli esperti (tra cui searchengi newatch.com, vedere anche riquadro). Peraltro, è solo da qualche tempo che l'accesso al database è diventato selettivo, per cui in esso rimangono ancora siti non proprio d'élite (del resto è improbabile che nel Web vi possa essere mezzo milione di siti di qualità, almeno attualmente).

Le insidie della ricerca base

La ricerca semplice2, accessibile dalla home page, è consigliabile solo se si utilizza una parola chiave singola. Utilizzandola con più parole chiave, Infoseek di default ricorre all'operatore booleano or, cioè trova tutte le pagine che contengono almeno una di esse.

Si deve fare attenzione a questa cattiva abitudine per due motivi. Primo, se una delle parole chiave è un termine molto comune, essa "coprirà" l'altra. Per esempio, cercando "Comune di Forlimpopoli", si otterranno oltre un milione di pagine che a vario titolo si occupano dei Comuni, e quello cercato si perde come un ago in un pagliaio. Inoltre, se i termini sono egualmente "popolari", c'è il rischio che non ci si renda conto che le pagine trovate ne contengono solo uno. Così, se si digita "vino doc" nella casella della ricerca semplice, si troveranno anche documenti che parlano di vino scadente. In realtà, Infoseek è in grado di riconoscere i termini più comuni, e conseguentemente di assegnare ai termini più rari un peso maggiore. Così, se le parole chiave cercate sono "Super" e "Pippo", Infoseek assegna un punteggio più elevato a quelle contenenti "pippo", termine meno frequente di "super".


Se si vuole effettuare una ricerca con due parole chiave è meglio affidarsi alla ricerca avanzata. In quella base, infatti, Infoseek considera i termini come connessi tramite l'operatore booleano or. Il rischio è che il termine più comune oscuri totalmente l'altro.

Cerca anche in un solo dominio

Per essere sicuri di ottenere risultati rilevanti, si deve però fare da sé, ricorrendo alla ricerca avanzata. Questa prevede una finestra di dialogo in cui si può specificare che si desidera trovare i documenti che contengono ognuna delle parole chiave, o una frase particolare. La finestra consente poi di fissare ulteriori criteri per la ricerca, in modo abbastanza semplice sebbene non al livello di Hot Bot (sempre meglio, comunque, di Altavista). Si possono indicare quali termini devono assolutamente comparire (opzione "must"), ma non escludere termini che possono essere fuorvianti (come "Baudo" se si cercano informazioni su Pippo, l'amico di Topolino). Si può ovviare in parte a questa mancanza con l'opzione "should not", che colloca i documenti contenenti il termine indesiderato in fondo alla lista.


Uno dei canali integrati di recente nella directory di Infoseek è dedicato alle donne. Tra i tanti servizi, bene accetti anche tra gli uomini, un database di nomi per le coppie in dolce attesa.

Curiosa, invece, l'opzione "should", che fornisce risultati che "potrebbero" contenere il termine richiesto. Il significato di tale "potrebbero" non è meglio specificato da Infoseek. Si può poi cercare un nome di persona, anche se il risultato ottenuto in genere è simile alla ricerca per frase (tranne nel caso in cui il nome è scritto in minuscolo in qualche pagina Web).

Per focalizzare ulteriormente la ricerca, cosa utile quando l'obiettivo è molto popolare, si può limitare questa ai titoli e agli url delle pagine Web. Quest'operazione presenta però dei potenziali inconvenienti. Innanzitutto gli url spesso sono nominati dai Webmaster in modo schematico, senza prestare particolare attenzione al contenuto della pagina (usando abbreviazioni, numeri, e così via). Raramente, quindi, sono significativi. Inoltre, va detto che non sono molte le pagine fornite della title tag, una stringa di codice nascosta all'utente che contiene il titolo della pagina scelto dal Webmaster.

Più utile appare la funzione "search location", che consente di restringere il campo a un singolo stato o a raggruppamenti di stati (Europa occidentale, Sud America, e via dicendo). Non è prevista invece la restrizione ai domini con estensione generica come .com, .net, .edu e così via. In compenso, è possibile cercare all'interno di singoli domini, come mondadori.com o yahoo.it.


I canali di Infoseek contengono sempre anche una serie di link consigliati. Quello dedicato alle news è personalizzabile in base alle categorie di informazioni che si prediligono.

Molto comoda l'opportunità, assente in molti altri motori, di cercare ulteriori parole chiave all'interno dei risultati ottenuti. Oppure, per le parole chiave più comuni, ci si può affidare ai best bet suggeriti da Infoseek. Sopra l'elenco dei risultati può infatti comparire un link a vari siti recensiti contenuti nei canali tematici di Infoseek. Non sempre però tali consigli sono azzeccati. In un test apposito, un collaboratore della rivista americana Internet World cercando le parole chiave "meaning of life" si è visto suggerire un link a "Baseball in Japan" (a quanto pare, la tecnica è stata migliorata e attualmente Infoseek per le medesime parole chiave indica un link ai comici inglesi Monty's Phyton e al loro celebre film "Il senso della vita").

Canali semplici, ma generici

I canali di Infoseek3 ricordano a prima vista le guide Web di Lycos, ma a un più attento esame in essi si ritrova un principio di catalogazione e selezione dei siti simile a quello di Yahoo!. Nella home page di Infoseek sono elencati vari channel, canali, ciascuno dei quali contiene delle sotto-categorie più specifiche, con una struttura a matrioska che prevede un massimo di tre livelli.


www.virgilio.it - Infoseek è integrato nel motore di ricerca italiano Virgilio, che si avvale del database americano per effettuare le ricerche a livello mondiale.

Rispetto a Yahoo!, dunque, le sotto-categorie di Infoseek perdono in specificità, a beneficio però della semplicità. Come si è già ricordato, è solo da qualche tempo che l'accesso al database è diventato selettivo. Tuttavia, i nuovi criteri di selezione stanno già producendo qualche risultato, al quale si aggiunge lo sforzo di classificazione dei siti, che vede diversi redattori all'opera per recensirli attribuendo a seconda della qualità fino a un massimo di tre "crocette" rosse. I criteri utilizzati da Infoseek sono di buon senso, ma non tarderanno ad arrivare le proteste di chi si sentirà penalizzato.

Infoseek consiglia…

La funzione d'orientamento di Infoseek è completata dalle pagine d'introduzione ai vari canali. In esse sono contenuti link consigliati, non solo alle home page di vari siti ma anche a particolari aree di interesse all'interno di essi.

La struttura può variare anche di giorno in giorno, a seconda del canale e delle scelte del responsabile redazionale (che si può contattare via posta elettronica). Per esempio, nel canale notizie, news4, la pagina contiene la notizia del giorno (fornita dall'agenzia Reuters), link alle altre notizie principali e alle varie sezioni come sport, politica e attualità, oltre alle previsioni del tempo. Questa pagina si può personalizzare per vedere sempre le notizie relative agli argomenti preferiti. Se non si riesce a trovare quanto si cerca, Infoseek offre la possibilità, direttamente dalla home page, con un clic sotto la casella di ricerca, di cercare alternativamente nei newsgroup o in un largo catalogo di aziende on line.

L'Infoseek italiano è Virgilio

Infine, va menzionata la versione nostrana (www.infoseek. it), anche se attualmente non è altro che un'interfaccia in italiano limitata ad alcune funzioni base della versione americana. Sono assenti la ricerca avanzata e i canali, al posto dei quali si trova un indice ipertestuale alle categorie di Virgilio.

La directory italiana ha stretto un patto di collaborazione con Infoseek (vedere PC Inter@ctive di febbraio), che a sua volta è il motore utilizzato da Virgilio per cercare nel Web.

Per sfruttare appieno le funzionalità di Virgilio conviene collegarsi direttamente all'omonimo sito5, spesso più adeguato al pubblico di casa nostra di quanto non lo siano i canali Infoseek pensati per i navigatori d'oltreoceano.



Altri Articoli Correlati
  • Quando i motori abboccano
  • L'osservatorio sui motori


  • CategoriaSottocategoria
    Software funzionale e di produttivita'Internet Publishing e browsing


    Aziende Citate
    INFOSEEK INCORPORATION

    top


    © Mondadori Informatica S.p.A. -1998
    Tutti i diritti di proprietα letteraria e artistica riservati